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A method for determining primer sequences and primer pairs for the production of a 
plurality of neighboring or overlapping PGR fragments for a given DNA sequence comprises the 
following steps: Listing a plurality of segments of the sequence which, based on their length, can 
be selected as primers; determination of the values of characteristic parameters for each segment, 
where a minimum of one parameter in the transition regions between parameter value ranges, for 
which the given parameter is considered optimum or unsuitable for producing PGR fragments, is 
continuously evaluated by means of a continuous and strictly monotonic transition fimction, with 
the given parameter value being assigned a value in correspondence with the quantity of the 
associated transition function; exclusion of segments which, with respect to a minimum of one 
parameter, are considered unsuitable for the production of PGR fragments; overall evaluation of 
the remaining segments by means of a weighted sum formation of the quantities assigned to the 
parameter values during the continuous evaluation; selection of the segments - which, based on 
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the overall evaluation, correspond to predetemiined selection criteria - as primers; and storage, 
display and/or readout of the selected segments as primer sequences and grouping into primer ' 
pairs. 



//insert Figure// 



Description 
[0001] 

The subject matter of the present invention relates to methods for determining primer 
sequences, in particular methods for selecting primes for a given DNA sequence on the basis of 
a continuous evaluation of characteristic primer parameters, devices for carrying out the 
methods, and uses thereof 

[0002] 

Sequencing, i.e., determining the order of nucleotides in nucleic acid sequences, is the 
basic method for deciphering the genetic code. In addition to identifying unknown sequences, 
sequencing also serves, among other things, to reveal individual differences in known sequences 
AVhen sequencing long DNA sequences, it is necessary, for technical reasons, to divide the 
sequences into manageable fragments, the so-called PGR fragments. These fragments are 
amplified by means of the polymerase chain reaction with highly specific oligonucleotides, the 
so-called primers. The fragments are bounded and determined by one primer pair on each side. 

[0003] 

The selection of the suitable primer pair - in particular the distance between the two 
primers in the sequence to be amplified, from which distance the length of the fragments results 
- is important for the properties of a PGR fragment. In addition, multiple binding sites of one or 
both primers in the sequence must be taken into consideration so as to be able to exclude 
potential by-products. To eliminate potential sequencing errors at the ends of the fragments, 
neighboring fragments with a minimum overlap of, e.g., 100 bases can be generated. Primed are 
highly specific reagents. Their quality depends on a plurality of parameters. Some of these 
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parameters are interdependent on one another: e.g., length, melting temperature, GC content, 3' 
pentamer stability, frequency of the 3'heptamer, and ability to form dimers or hairpins. 

[0004] 

There are several known computw programs which can be used to select high-quality 
primers for individual PGR fragments: e.g., "PrimerS" (S. Rozen et al. in "Methods Mol. Biol." 
132, 2000, pp. 365-386) or prime+ (GCG - Genetics Computer Group, 1 998), Program Manual 
for the GCG Package, Version 10, 1998, 575 Science Drive, Madison, Wisconsin 5371 1, USA). 
These programs, however, are not designed to efficiently generate overlapping PGR fragments 
for sequencing very long genome segments. 

[0005] 

In the method implemented with "PrimerS," a plurality of segments of a predetermined 
sequence are tested with respect to a group of predetermined characteristic primer parameters. 
For each parameter, a range of values or/and an optimum value is/are defined, within which 
range or optimum value segments of the DNA sequence are suitable as primers. Values outside 
the range/optimum value are penalized by means of a reduction of points. The selection of a 
relatively large number of PCR primers is inefficient because of the discontinuous eA^uation 
which acts as an excessively restrictive filter. 

[0006] 

Thus, the problem to be solved by the present invention is to make available a new 
method for determining primer sequences by means of which the above-mentioned 
disadvantages of the conventional methods can be overcome and which makes possible an 
automated selection of PCR primers. Another objective of the present invention is to make 
devices available for implementing the methods as well as uses of the methods. 

[0007] 

These problems are solved by means of the methods, computer program products or 
devices with the features according to Claims 1, 1 1, arid 12. Useful embodiments of this 
invention follow from the dependent claims. 

[0008] 

The basic idea of this invention is to cover the DNA sequence on the basis of a 
continuous evaluation and a weighted overall evaluation of the primer parameters with optimum 
primer pairs. In addition to the conventional parameters (see above), it is possible to include any 



■ 4 

other parameters as well. Because of the continuous evaluation and weighting of all parameters 
under consideration, the method according to the present invention optimizes the primer quality 
for automated sequencing. 

[0009] 

The present invention has the advantage that the suitability of a segment to serve as a 
primer is evaluated more objectively and more realistically than is possible with the conventional 
techniques and that the analysis of long DNA sequences in the form of overlapping sequence 
segments as units for analysis is made possible in an efficient manner. This makes possible a 
high analytical throughput at a low downtime rate which results in savings in material, labor, and 
time. 

[0010] 

Another subject matter of the present invention relates to a computer program for 
implementing the method described. 
[0011] 

Yet another subject matter of the present invention relates to a device for determining 
primer sequences with a means for identifying a plurality of segments of a given sequence and 
for evaluating the characteristic primer parameters, a first selection means which is designed to 
dispose of segments of the sequence that are unsuitable as primer sequences, a second selection 
means which is designed to compare the sum of the individual weighted evaluations of the 
remaining segments with a predetermined selection criterion, e.g., an absolute threshold value 
and/or a maximum value formation, and a third selection means which is designed to determine 
the optimum primer pairs. The device according to the present invention also comprises means 
for the storage, the readout and/or the display of the determined primer sequences and primer 
pairs. 

[0012] 

The method according to the present invention can be usefully employed in many 
applications in biology, biotechnology, human and veterinary medicine, agricultural sciences, 
ecology, and all other fields in which the sequencing of nucleic acids comes into play. 

[0013] 

Additional advantages and details of the present invention follow fi"om the explanation of 
the process sequence, the description of an example, and the enclosed drawing. Figure I shows 
an example of a continuous transition fimction used according to the present invention to 
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evaluate a primer parameter (x-axis: parameter values, y axis: evaluation of the parameter 
values). 

Dptailed dcscriptioti of the method accor ding to the present invention 
[0014] 

The objective of the present invention is to automatically select PGR primers with a 
continuous evaluation of the parameters on the basis of a randomly long, known sequence (the 
sequence which is obtained, e.g., from the EMBL (European Molecular Biology Laboratories) 
database and by means of predetermined parameters. For this purpose, first the entire length or a 
suitable fragment of the sequence is characterized for all possible fragments along this length 
with respect to the primer parameters of interest. The characteristic parameters comprise specific 
properties of the primer (e.g., primer length, GC content, melting temperature of the primer, etc.) 
as well as parameters which characterize predetermined criteria (e.g., 3'pentamer stability, 
frequency of the 3'heptamer, or the occurrence of repetitive sequences ("repeats"). 

[0015] 

The fragment lengths and the minimum overiapping range of the individual firagments are 
pre-specified as a function of other factors, e.g., the sequencing method, the reagents used, and 
the length of the DNA segment to be sequenced. In addition, regions of the DNA to be 
sequenced can be "masked" if no PGR primers are to be selected from them. These may be 
sequence regions which occur frequently in the genome (so-called "repeats") or known 
polymorphisms and other sites that are unsuitable for the selection of the primers (e.g., within an 
exon). On the basis of all of the given specifications, the optimum primers are determined. 

1. rharacterization of the r nmplete sequence 
[0016] 

In a first step, the complete sequence is tested with respect to the included parameters for 
all potential primer positions and lengths. Among other things, repeat regions, known 
polymorphisms, and other sequence regions that are unsuitable for the primer selection are 
masked. In a second step, the values of the included parameters (e.g., GC content, melting 
temperature, 3'pentamer stability, etc.) are determined for all predetermined primer lengths. 
Subsequently, a value between 0 and 1 is assigned to each parameter on the basis of a parameter- 
specific continuous or discontinuous transition function. 
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[0017] 

According to the present invention, the transition functions can assume continuous values 
between 0 and L "1 " and "0" can also be described, respectively, as "optimum suitability" and 
"no suitability" as primers with respect to the concrete property. One example of this is 
illustrated in Figure 1 for the primer GC content (guanosine plus eytosine content). To values 
above and below predetermined upper and lower threshold values A and D, respectively, 0 is 
assigned. Primers with a parameter to which 0 was assigned may not be selected. Within the 
interval that is bounded by the threshold values A and D, there are two other threshold values (B, 
C). To the enclosed interval from B to C, 1 is assigned, i.e., the parameter is optimally suitable 
within the range of values from B to C. The optimum for each parameter may cover a relatively 
wide range of values. The optimum is flanked by regions (the region between A and B and that 
between C and D) in which the quality of the potential primer for the parameter under 
consideration decreases. In these regions, a continuous evaluation is performed by means of a 
minimum of one transition function. This decrease can be characterized by the most varied 
functions, which can differ even from one parameter to the next. 

[0018] 

As illustrated in Figure 1 , to mathematically describe the evaluation of a parameter in 
these two regions, e.g., linear functions and trigonometric functions are suitable. As a result, this 
makes possible a continuous evaluation of all or of selected parameters which characterize a 
primer. In contrast to the already available methods of primer designs, the evaluation of the 
parameters does not take place discontinuously. 

2. Overall evaluation 
[0019] 

Based on the individual evaluations of all parameters of a primer thus obtained, an 
overall evaluation is made. Once an included parameter of a primer has been assigned the value 
0, this primer is excluded from the selection. For all remaining potential primers, the overall 
evaluation is made by means of a summation of the evaluations of all included parameters, with 
the possibility of also freely selecting a weighting of each individual parameter. To determine the 
optimally suitable primer pairs, a weighted continuous evaluation of the fragment length (which 
results from the positions of the forward and backward primers in the sequence) and of the two 
melting temperatures of the primers is carried out in addition to the overall evaluation of the two 
individual primers. For this purpose, a continuous evaluation of the difference in the melting 
temperature between the forward and the backward primer is made. 



[0020] 

The primer pair with the highest sum of weighted evaluations is selected. In addition to 
the 5 'end of the sequence, critical, e.g., masked, regions can be used as the starting point for the 
selection of primer pairs as welL 

Example 

1 . Selection of the characteristic parameters and the transition functions thereof 
[0021] 

The objective is to determine primers for the sequence with the Accession Number 
"D26607" from the EMBL database ("http://www.ebi.ac.uk/cgi-bin/emblfetch7D26607"). The 
sequence has a length of 23,142 bp (base pairs). Primers for the region between base pair 1 and 
4000 are to be sampled. The PCR fragments are to have a length of 1050 bp. The overlap of the 
fragments should be at least 1 00 bp. The primers are to have a length of 1 8 to 27 nucleotides. If it 
is not possible to generate fragments, the length of which differs almost by 120 bp from the 
predetermined fragment length, the predetermined fragment lengdi is to be increased or 
decreased by 350 bp. The following parameters are included as the characteristic parameters of 
the primers: 

- Length 

- GC content 

- Melting temperature 

- Number of 3 ' heptamer in the complete sequence 

- Free energy of the 3'pentamer 
-Masking 

- Belonging to an exon 

- Occurrence of the 3 'heptamer within a region of 10 kbp. 
[0022] 

The last three parameters can assume only the values 0 or 1 . All other parameters are 
continuously evaluated. Primers for which the value 0 is assigned to a minimum of one 
parameter are excluded from the subsequent calculations. 

[0023] 

or the evaluation of the parameter values between points A and B as well as between C 
and D, two functions are selected (see Figure 1): 
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- for region [A, B[: 
Function 1 : 



//insert AJI 

Function 2: 



//insert B// 

- for region ]C, D]: 
Function 3: 

//insCTt CI I 

Claims 

] . A method for determining primer sequences and primer pairs for the production of a 
plurality of neighboring or overiapping PCR fragments for a given DNA sequence, comprising 
the following steps: 

- Preparation of a list with a plurality of segments of the given sequence which, on the basis of 
their length, can be selected for use as primers, 

- Determination of the values of characteristic parameters for each segment, where a minimum of 
one parameter is continuously evaluated by identifying parameter value ranges which are 
characteristic for the parameter and for which the given parameter is considered either optimum 
or unsuitable for the production of PCR fragments and where these parameter value ranges are 
separated by transition regions which are represented by transition functions that are continuous 
and which follow a strictly monotonic course, with an evaluation correspondinjg to the quantity 
of the associated transition function being assigned to the respective parameter value in the 
transition regions, 

- Exclusion of the segments which, with respect to a minimum of one parameter, are unsuitable 
for use in the production of PCR fragments. 
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- Overall evaluation of the remaining segments by means of a weighted sum fomiation of the 
quantities assigned to the parameter values during the continuous evaluation, 

- Selection of the segments, which, based on the overall evaluation, correspond to predetermined 
selection criteria, as primers and 

- Storage, display and/or readout of the selected segments as primer sequences and grouping into 
primer pairs. 

2. The method as claimed in Claim 1 , in which the position of the segment in the 
sequence, the length of the segment, the GC content, the melting temperature, the 3* oligomer 
stability, the 3 'oligomer frequency and/or the masking of unsuitable sequence regions are 
determined as the parameters for the segment. 

3. The method as claimed in Claim 2, in which segments with lengths of less than 1 2 and 
more than 35 nucleotides are evaluated as being unsuitable and segments with lengths of 20 to 
24 nucleotides are evaluated as being optimum. 

4. The method as claimed in Claim 2 or 3, in which segments with a GC content of lower 
than 1 5% and higher than 85% are evaluated as being unsuitable and those with 45% to 55% are 
evaluated as being optimum. 

5. The method as claimed in one of Claims 2 through 4, in which segments with a 
melting temperature lower than 30°C and higher than 90X are evaluated as being unsuitable and 
those in a temperature range between 50°C and 55**C are evaluated as being optimum. 

6. The method as claimed in any one of the preceding claims, in which the transition 
functions are formed by trigonometric functions, linear functions, or overlaps thereof. 

7. The method as claimed in any one of the preceding claims, in which the selection of 
"^segments as primers with respect to the fragment length takes place so that, given a 
predetermined optimum length of segments for a first selected segment on a strand of the 
sequence, the segments on the other strand are evaluated as being unsuitable if they lead to a 
fragment length which is lower than a predetermined minimum length or higher than a 
predetermined maximum length. 

8. The method as claimed in any one of the preceding claims, in which the selection of 
segments as primers takes place so that for a first selected segment on the one strand of the 
sequence, the segments on the other strand are evaluated as being unsuitable if both segments, 
show a difference in the melting temperature that is higher than 1 0°C, with the segments being 
evaluated as being optimum if the difference in the melting temperature is lower than 0.5®C. 

9. The method as claimed in Claim 8, in which, in a sequence region for which a segment 
on the one strand of the sequence is to be selected as a primer, the 1 5 primers with the highest 
overall evaluations of the individual primers are pre-selected and for which, in correspondence 
with the predetermined optimum fragment length, the optimum associated segments on the 
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oppositely lying strand are selected, with the pair with the highest overall evaluation - that 
results from the evaluation of the individual segments, the difference of the melting temperature 
between the involved primers, and the fragment length - being selected from the pairs of 
segments thus formed. 

1 0. The method as claimed in Claim 9, in which, within a predetermined region of the 
sequence, the position of the primer relative to the neighboring fragment is identified as an 
additional parameter so as to form a predetermined minimum overlap. 

1 1. A computer program product which is designed to determine primer sequences and 
primer pairs using a method according to one of the preceding claims. 

1 2. A device for determining the primer sequences and primer pairs, using a method 
according to one of the preceding claims and comprising: 

- a means for deterrnining a plurality of segments of a given DNA sequence and of associated 
characteristic parameters, 

- an evaluation means for evaluating the determined parameters, 

- a first selection means which is designed to dispose of segments of the sequences that are 
unsuitable as primers, 

- a second selection means which is designed to evaluate the remaining segments, and 

- means for the storage, readout and/or display of the primer sequences and primer pairs 
determined. 

Includes 1 page of drawings 
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Die f olgefMlen Angaben sind dan vom Anmelder 

Verfahren und Vorrichtung zur Ermitttung von Primer^Sequenzen 

Ein Verfahren zur Ermittlung von Primer-Sequenzen [ 
und Primer-Paaren zur Erzeugung einer Vielzahl benach- 
barter oder uberlappender PCR-Fragmente fur eine gege- 
bene DNA-Sequenz umfasst die Schritte: Auflistung einer 
Vielzahl von Teilabschnttten der Sequenz» die aufgrund ih- 
rer Lange als Primer ausgewahtt werden konnen; Ermitt- 
lung der Werte von charakteristischen Parametern fur je- 
den Teilabschnitt, wobei mindestens ein Parameter in 
Ubergangsbereichen zwischen Parameterwerteberei- 
chen, fur die der jeweilige Parameter ats optimal oder als 
ungeeignet zur Erzeugung von PCR-Fragmenten gilt, mit 
einer stetigen und streng monotonen Ubergangsfunktion 
kontinuiertich bewertet wird, wobei dem jeweiligen Para- 
meterwert eine Bewertung entsprechend der Grd&e der 
zugehdrigen Obergangsfunktfon zugeordr>et wird, Aus- 
schluss von Teilabschnitten, die in Bezug auf mindestens 
etnen Parameter als ungeeignet zur Erzeugung von PCR* 
Fragmemen t>ewertet werden; Gesamtbewertung der ub- 
rigen Teilabschnitte durch gewtchtete Summenbildung 
der den Parameterwerten bei der kontinuieriichen Bewer- 
tung zugeordneten Gro&erv Auswaht der leilabschnitte 
als Primer, die nach der Gesamtbewertung vorbestimm- 
ten Auswahlkrherien entsprechen; und Speicherung, Arv 
zeige und/oder Ausgabe der ausgewahlten Teilabschnitte 
als Pnmer-Sequenzen und Anordnung zu Primer-Pearen. 
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Beschieibung " 

[0001] Die Erfindung bctzim Vcrfahccn zur EnniUluog voo Primcr-Scqucnzcn, iDsbcsoodcrc VcriahiCD zur Primer- 
Auswahl fur cine voigegebeoe DNA-Sequenz auf der Grundlage einer kondnuierlichen Bewertung charakterisdscber 

5 Prim^-Parameter, >^)rricbmngen zur Durchfuhning der Verfahrea uod dereu Anwendungeo. 

[0002] Die Sequenzierung, d. h. die Krmittlung der Nukleotidabfolge in Nukleinsaure-Sequenzen, ist das fundamentale 
Verfahren zur Entschlussdung des geoetiscfaen Codes. Neben der Aufklarung unbekannter Sequenzen dieot die Sequei>- 
zierung u. a. dazu, individuelle Unterschiede in bekanoten Sequenzen zu ermitteln. Zur Sequenzierung von langen DNA- 
Sequenzen ist es aus technischen Griinden erforderlich, die Sequenzen in handhabbare Unterabschmtte» die PCR*Frag- 

10 mcntc, zu untcitcilcn. Dicse Fragmcnic wcrdco mittcls PbSymcraso-Kcttcnicaktion nut hochspczifischcn Oligonuklcol]- 
den, den sogenannten Pkimem, amplifiztert. Die Fragmente weiden durch jeweils ein Pdmer-Paar begyenzl und be- 
sdmmL 

[0003] FQr die Eigcnschaftcn cincs FCR-Fr^mcnts spiclt die Auswahl des cntsprcchcodcn Primcr-Paaics cine wcscnt- 
licbe RoUe, insbesondere der Abstand der bdden Primer auf der zu amplillzierendeo Sequenz, aus dem sich die Frag- 

15 mentiange eigibt AuBerdem mussen multiple Bindungsorte eines oder beider Primer auf der Sequenz berucksichdgt 
wcrden, um mogUchc Ncbcnproduktc auszuschiicBcn. Um moglicbc Scqucnzicningsfchlcr an den Endcn der Fragmcnic 
zu eliminieien, konneo benachbaite Fragmente mil einer Mindesdibcriappung von z. B. 100 Basen generiert werden. Pri- 
mer steilen hochspezifische Reagenzien dar. Ihre Qualilat hangt von einer Vielzahl von Paramclern ab. Diesc Parameter 
sind teilweise voneinander abhangig: z. B. T^nge, Schmelztemperabir, GC-<}dialt, 3 -Pbntamerstabilitat, HSufigkeit des 

20 3'-Heptaniers und Fabigkeil zur Dimer- Oder Hairpinbildung. 

[0004] Hs sind zahlreiche Computerpcogramme bekannt, mil denen Primer in guier Qualilat filr dnzelne PCR-Frag- 
mente ausgewahlt werden konncn: z. B. "PrimerS" (S. Rozen el al. in "Methods Mol. Bid.", 2000, 132, 36S-86) oder 
primf>f (GCG ~ Gcncdcs (k)mpulcr Group, (1998), Plogram Manual for the GCG Package, Msision 10, 1998, 575 Sci- 
ence Drive, Madison, ^sconsin, USA 53711). Diese Programme sind alterdings nichi mr die effiziente Generierung 

25 aberlappender PCR-Fragmente zur Sequenziening sehr langer Genomabschnitte ausgelegt. 

[0005] Bci dcm von "Primcr3" umgesctztcn \ferfahrcn wird cine Vielzahl von Tcilabschniltcn cincr vorgcgcbcncn Se- 
quenz in Bezug auf dne Gnippe voigegebener cfaarakteristischer Primer-Parameter untersucht Fur jeden Parameter wild 
ein Wertebereich odei/und ein Optiraalwert definiett, iimerbaib dessen Tdlabschnitie der DNA-Sequenz als Primer ge- 
eignet sind. Wertc auBerhalb des Bereichs/OptimaJwerts werden mil einem Punktab74ig bestrafu Die Auswahl einer gro- 

30 Beren Anzahl von PCR-Primeni ist wegen der diskontinuieriicben Bewertung, die einen zu sttengen Filler darstelll, un- 
effektiv. 

|0006| Die Aufgabe der Erfindung ist es, ein neues \%rfahren zur Hrmittlung von Primer-Sequenz^n anzugeben, mit 
dcm die obcn crlautcrtcn Nachtcilc der bcrkomihlichen ^^rfahrcn ubcrwundcn werden und das cine automatisicrtc Aus- 
wahl von PCR-'Priintem ermdglicht Die Aufgabe dor Erfindung ist es auch, Vnrichtungen zur Umsetzung der VbrfahieD 
35 und Anwendungen der Wrf^iren bereitzustellen. 

[0007] Dicsc Aufgabcn wcnicn mil Vcrfahicn, Computcrprogrammpioduktcn oder ^Axrichtungcn mit dca Mcrkmalcn 
gemaB den Patentanspruchen 1, 1 1 und 12 gelost Vorteilhafte Ausfuhningsformen der Erfindung eigeben sich ais den 
abhangigen Anspruchen. 

[0008] Die Grundidee der Fjrfmdung ist es, die DNA-Sequen% auf der Grundlage einer konlinuierlichen Bewertung so- 
40 wic einer gewichteten Gesamtbewertung der Frimer-ParametK mil besten Primer-Paaren abzudecken. Als Parameter 
kfinnen neben den gebrauchlicben (s. o.) auch jcder weitere Plarameter einbezogen werden. Das erfindungsgemaBe Vfer- 
fahren oplimiert die l^merqualilat fur die automatisicrtc Sequenzierung durch konlinuierliche Bewertung und AVichlung 
aller betracfateten Parameter. 

[0009] Die Erfindung besitzt den VorteiU dass die Eignung eines Teilabschnitts als Primer objektiver bzw. realistischer 
45 beweitet wird als bei den hcrkommlichen Techniken und dass die Analyse von langen DNA-Sequenzen in Form Dber- 
lappendcr Scqucnzabschnlttc als Analysccinhcilcn in rationcllcr Wcisc crmoglichl wird. Damit wird ein hoher Analysc- 
durchsatz bei einer geringen Ausfallquote erzielt, woraus sich eine Hnsparung an Material, Arbeit und Zeit etgibt 
[0010] Gegenstand der Erfindung ist femer ein Computerprogramm zur Umsetzung des genannten \%rfahiens. 
(0011) Gegenstand der Erfindung ist auch cine Vbrrichtung zur Ermittlung von Primer-Sequenzen mil einer Hinrich- 
50 tung zur Erfassung einer Vielzahl von Teilabschnitten einer gegebenen Sequenz und zur Bewertung der charakterisd- 
schen Primer-Parameter, einer erslcn Auswahleinrichtung, die dazu ausgelegt ist, als Primer-Sequenzen ungeeignele Tfei- 
labschnilte der Sequenz zu verwerfen, einer zweilen Auswahleinrichtung, die dayu ausgelegt ist, die Summe der gewich- 
teten Einzelbewertungen der iibrigen Teilabschnitte mit einem voibestiramten Auswahlkriterium, z. B. einem Absolut- 
scbweUwert und/oder dner Maximalwertbildung, zu veigleichen, und einer dritten Auswahleinrichtung, die dazu ausge- 
55 l^t ist, die besten Primer-Paarc zu ermitteln. Die erfindungsgemSBe Vbrrichtung umfasst auch Einrichtungen zur Spct- 
cherung, Ausgabe und/oder Anzeige der ermittelten Primer-Sequenzen und Primer-Paare. 

[00121 Das erfindungsgemaBe Verfahren besitzt vorteilhafterweise zahlreiche Anwendungen in der Biologic, Biotech- 
nologie. Human- und Velerinarmedizin, Agrarwirtsdiaft, Okologie sowie alle anderen Gebieten, in denen die Sequenzie- 
' rung von Muklcinsaurcn cine Rollc spiciL 
60 [0013] Weitere Vortdle und Einzelheiten der Erfindung werden aus der folgenden Beschreibung des ^^rfahrensablau- 
fes, der Eriaulerung eines Beispiels und der bcigefiigten Zeichnung, ersichtlich. 1 zeigl dn Bdspid fiir eine crfin- 
dungsgemaB verwendete konlinuierliche Ubeigangsfunktion zur Bewertung eines l^nier-l^arameleis (x-Achse: Parame- 
terwerte, y-Achse: Bewertung der Parameterwerte). 

65 Einzelheiten des crfindungsgemaBen \ferfahrens 

[0014] Erfindungsgemafi ist insbesondere vorgesehen, dass auf Basis einer beliebig langen, bekannten Sequenz (der 
Sequenz, die z. B. aus der EMBL (European Molecular Biology Laboratories)-Datcnbank stammt) und anhand festge- 
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legter Parameter PCR-Primer automadsch mit dner koQtinui^Fticfaei^ Beweitung der Parameter ausgewahlt wettieil: 
Dazu wild die Sequenz zunachst uber ihie gesamte Lange oder eio entsprecbendes Ifeilstudc fiir alle moglicbea Teilab^ 
sdmiuc aurdicscr Langc in Bczug auf die inlciCssiciCDdcD IVimer-Paramelcr cbaiaktcrisicct. Die charaktcristischcn Pa- 
rameter umfassen bestimmte Eigenscfaaften des Primeis (z. B. Prinierlange» GC-Gehait, Primer-Schmelztemperatur 
usw.) und Parameter, die festgelegte Kriterien cbarakterisiereD (z. J-Pentamerstabilitat^ Ilaufigkeit des 3 -Ileptamers 5 
oder das Vorkommen von lepeddven Sequen/en ("repeats'*)). 

[0015] Id Abhangigkeit von andereo Faktoreo, z. B. der Sequenziennethode, den verwendeten Reagenzien und der 
Lange des zu sequenzieiendeo DNA-Abscbnitts weiden die Fragmentlangen und der Mindestuberlappungsbereicb der 
elnzelnen Fragmente voigegeben. AuBerdem konnen Bereiche der zu sequenzierenden DNA "maskiert* werden, wenn 
aus dicscn kcinc PCR-PHmcr ausgewahlt wcrdcD soUcn. Dies k5iiDcn Scquenzbcicicbc scin, die im Gcoom haufig vor- to 
kommen (sogenannte "repeats**) oder bekannte Psolymorphismen sowie andere fur die Ptimer-Auswahl ungeeagnete One 
(z. B. innerbalb eines Exons). Auf der Grundiage alter festgei^ten >^aben werden die optimalen PHmer ennittelL 

1. Charakt^sienmg der gesaraten Sequenz 

IS 

[0016] In cincra crstcn SchriU witd die kompicUc Sequenz hinsicbtlich der cinbczogcncn Parameter rOr allc polcndcl- 
ten Pdmerpositionen und -langen untersucht Es werden ti. a. rq^eat-Regionen, bekannte Polymoq>hismen sowie weitere 
fur die Primer-Auswahl ungeeignete Sequenzbereiche maskiert. Fur alle voigegebenen Primcriangen werden in einem 
zweiten Schritt die Werte der einbezogenen Parameter bestimmt (z. B. GC-Gehalt, Schmelztemperatur, 3'-Penianieisla- 
bilital u. a.). Anschliefiend wird jedem Parameter auf der Grundiage einer parameterspezifischen kondnui^lichen oder 20 
diskontinuieriichen Ubergangsfunkdon eine Bewertung zwischen 0 und 1 zugeordneL 

[0017] Die t)bergangsfiinktionen k5nnen erfindungsgemaB einen zwischen 0 und I kontinuierlichen Werteveriauf be- 
sitzcn. "l** und "0" konnen auch als "bcslc Etgnung** bzw. '*kcinc Eignung** als Primer hinsicbtlich der konkrctcn Eigcn- 
schaft beschrieben werden. Ein Bdspiel hierfur ist in Fig, 1 fiir den Primer-GC-Gehatt (Guanosin-Cytosin-Gehalt) iUu- 
striert Fur Werte oberhalb und unterhalb votbestimniter oberer und unterer Grenzwerte A bzw. D erfolgt die Bewertung 25 
mit 0. Primer mit cinem mil 0 bewcrtctcn Parameter durfen nicbt ausgcwShlt werden* Inncrhalb des durcb die Grenz- 
werte A und D aufgespannten Intervalls sind zwei weitere Grenzwerte (B, C) voigesehen. Im abgeschlossenen Interval] 
von B bis C erfolgt die Bewertung mit 1 , d. h. der Parameter ist im Wertebereich von B bis C optimal geeignet Das Op- 
timum fiir dnen jeden Parameter darf einen lelativ groBen Wertebereich umfassen. Das Optimum wird von Bereichen 
flankiert (Bereicb zwischen A uixl B sowie zwischen C und D), in denen die Qualitat des moglichen Primers fur den be- 30 
trachteten Parameter abfallt In diesen Bereichen wird eine kontinuierliche Bewertung duich mindestens eine Uber- 
gangsfiinktion gebiklet Dieser Abfall kann durch unterschiedlichste Funktionen, auch verschieden fiir unteischiedliche 
Parameter, charaktcrisicrt werden. 

10018] Zur mathemadscben Beschreibung der Bewertung eines Parameters in diesen beiden Bereichen eignen sich 
u. a. lineare Funkdonen und Winkelfiinktionen, wie in Fig. 1 daigestellt Dadurcb ist eine kontinuierliche Beweitung al- 3S 
Icr bzw. ausgewahltcr Parameter, die einen Primer charaktcrisicrcn, moglich. Im Gcgeosatz zu den bercits vcrfiigbarcn 
Verfahren zum Primer-Design erfolgt die Bewertung der Parameter nicht sprungbaft 

2. Gesamtbewertung 

40 

(0019] Anhand der so gewonnenen Einzelbewertungen alter Parameter eines Primers wird eine Gesamtbewertung 
durchgefiihrt. Ist ein einbe/xigener Parameter eines Primers mit 0 bewertet worden, so wird dieser Primer von der Aus- 
wahl ausgeschlossen. Fiir aUe ubrig^ moglichen Primer erfolgt die Gesamtbewertung durch Sunmiation der BewertuiF 
gen alter einbezogenen Parameter, wobei auch eine Wichtung jedes einzehien Parameters &ei gewahlt werden kann. Zur 
Bestimmung der am besten geeigneten Primer-Paare wird neben der Gesamtbewertung der beiden einzelnen Primer zu- 45 
satzlich eine gcwichtctc kontinuierUchc Bewertung der Fragmcndangc (die aus den Posilioncn von \forwarts- und Rik:k- 
wartsprimer auf der Sequenz resuldert) und der beiden Primer-Schmelztemperaturen vorgenonunen. Dazu erfolgt dne 
kondnuieriiche Bewertung der Schmeiztemperatur-Differenz zwischen Vorwarts- und Riickwartsprimer. 
[0020] Das Primer-Paar mi t der hochslen Summe der gewichteten Bewertungen wird ausgewahlt. Ausgangspunkte zur 
. Auswahl von Primer-Paaren konnen neben dem 5*-Ende der Sequenz auch kridsche, z. B. maskierte Bereiche sein. SO 

Beispiel 

1 . Auswahl der charakterisdschen Parameter und deren Ubergangsfunkdonen 

55 

[0021] Es sind Primer fur die Sequenz mit der Accession Number T>26607" aus der EMBLrDalenbank 
(**http:/ / www.ebLac.uk/cgi-btn/emblfetch7D26607'') zu ermitteln. Die Sequenz hat eine Lange von 23142 bp (Basen- 
paaren). Es soUen Primer fur den Bereich zwischen dem Basenpaar I und 4000 exemplarisch ausgewahlt werden. Die 
PCR-Fragmentc sollcn cine l^nge von 1050 bp habcn. Die Ubcrlappung der Fragmente soil mindestens 100 bp bctra- 
gen. Die Primer soUen eine Lange von 18 bis 27 Nukleodden haben. Wenn keine Fragmente generiert werden konnen, 60 
deren Lange hochstens um 120 bp von der vorgegebenen Fragmendange abwdcht^ soil die vorgegebene Fragmendange 
um 350 bp erhdht b/w. verringert werden. Als charaklerisdsche Parameter der Primer werden die folgenden einbezpgen: 

- Lange» 

- GC-GehalU 65 

- Schmelztemperatur, 

- Anzahl des 3*-HeptameTS in der Gesamtsequenz, 

- Freie Energie des 3 -Pentamers, 
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- Maskiening* "^"i^ 
" ZugehSrigkdt zu dnem Exoa, 

~ V)rkoimiicn dcs 3 -HqpUnncrs iimcrfaalb cincs Bcicichcs von 10 kbp. 

5 [0022] Die letztea did Parameter konnen nur die lA^rte 0 oder 1 annefamen. AUe Ubrigen Paraineler werdeo koDdnu- 
ierlich bewerteL Primer* fur die wenigstens dn Parameter mit 0 beweitet wuide, werden von den wdceren Berechnimgen 



I0Q23] Fur die Bewertung der Parameterwerte zwisdien deo Punkteo A und B sowie C und D werden zwei Funktioneo 
ausgewahk (siehe Fig. 1): 

10 

- fQrdenBetdcbiA,Bl: 



15 



20 



25 



FkLl: 

1 



B-A B"A 

Fkt2: 



- fUrdcnBcicicbK:*D]: 
FkL3: 

y= *x+- 



D-C D-C 

30 PateotansprUcbc 

1. Verfahren mr Hrmittlung von Primer-Sequenzen und Primer-Paaren zur Erzeugung einer Vidzahl benachbarter 
Oder iibcrlappcndcr PCR-Fragmcntc fur cine gcgcbenc DNA-Soqucnz, mit den Schrittcn: 

- Hrstellung einer Liste mit eioer Vielzahl von Tdlabschnitten der gegebenen Sequenz* die aufgrund ihier 
35 LSnge als Pkimer ausgewablt werden konnen, 

~ Ermittlung der Wcrtc von cbaraktcrisdschcn Paramctcm fOr jcden Tdlabschnitt, wobd mindcstcns cin Pa- 
rameter kontinuierlicb beweitet wird, indem flir den Parameter charakteristiscbe Parameterweitebereiche er- 
fasst weiden, fiir die der jeweilige Parameter entweder als optimal oder als ungeeignet zur Erzeugung von 
PCR-Fragmentcn gilt, und diese Parameterwerteberdche durch Ubeigangsberdche gelrennl wenlen, die durch 
40 Ubergangsfunkdonen leprisentieit werden, die stetig sind und einen streng monotonen \^lauf besitzen, wobei 

. dem jeweiligen Parameterwert in den t)beigangsbeidchen eine Bewertung entspcechend der Gr58e der zuge- 
horigen Ubergangsfunktion zugeordnel wild, 

- Ausschluss von Tdlabschnitten, die in Bezug auf ndndestens einen Parameter als ungeeignet zur Eizeugung 
von PCR-Fragmenten bewertet werden, 

45 - Gesamtbewertung der ubrigen Teilabschnitte durch gewichtete Summenbildung der den Parameterweiten 

bd der kondnuicrlichcn Bewertung zugcoidncicn GroBcn, 

Auswahl der Teilabschnitte aU Primer, die nach der Gesamtbewertung vorbestimmten Auswahlkriterien ent- 
spiechen, und 

- Spdcherung, An/dge undAnder Ausgabe der ausgewahlten Teilabschnitte als Primer-Sequenzen und Anord- 
50 nung zu Primer-Paaien. 

2. Verfahren gemaB Ansprucb 1 , bei dem als Parameter die Position des Ibilabscbnittes auf der Sequenz, die LSnge 
des TeilabschniUes, der GC-Gehalt, die SchmelztemperaUir, die 3'-01igoniehrstabilitat, die 3*-Oligomehrhaufigkdl 
und/oder die Maddening ungedgneter Sequenzberdche fur den Teilabschnia ermittelt werden. 

3. Verfahren gemaB Anspruch 2, bd dem Ibilabscfamtte mit Langen von weniger ais 12 und mehr als 35 Nukleod- 
55 den als ungedgnet und mit Langen von 20 bis 24 Nukleodden als optimal bewertet werden. 

4. Verfahren gemaB Anspruch 2 oder 3, bei dem Teilabschnitte mit CKM jehaiten von weniger als 1 5% und mehr als 
85% als ungedgnet und von 45% bis 55% als opdmal bewertet werden. 

5. Verfahren gemaB dneni 6cr Anspriiche 2 bis 4, bei dem Tfeilabschnitte mit Schmelztemperaturen von weniger als 
3(fC und mehr als 9(fC als ungedgnet und im Tcmpcraturbcrdch von 5(fC bis 55°C als opdmal bewertet werden. 

60 6. Verfahren gemaB dnem der vorhergehcnden Anspriiche, bei dem die Ubergangsfunkdonen durdi Winkelfunk- 

donen, lineare Funkdonen oder Ubertagerungen aus diesen gebildet werden. 

7. Verfahren gemaB dnem der vorhergehenden Anspriiche, bei dem die Auswahl von TeilabschniUen als Primer in 
Bezug auf die Fragmendange derart erfolgt, dass bei dner vorbesdmmten opdmalen Lange voo Tdlabschnitten fur 
dnen zuerst au^wahlten Tdlabschnitt auf dem dnen Strang der Sequenz die Teilabschnitte auf dem andeien 

65 Strang als ungedgnet bewerteL werden, wenn sie zu dner Fragmendange fiihren, die geringer als dne vorbestirnrnlc 

MindesUange oder groBer als eine vorbesdmmte Maximallange isL 

8. >^rfahren gemaB dnem der vorhergehenden Anspriiche, bei dem die Auswahl von Teiiabschnitlen als Primer 
derart erfolgt, dass fiir dnen zuerst ausgewahlten Teilabschniu auf dem einen Strang der Sequenz die Teilabschnitte 
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auf dem andeien Strang als ungeeigDCt beweitet weiden, wean beide Tdlabschnitte eine SchmelztemperaturdiQe- 
cenz besitzeb,db groBer als lO^CisU wobei dielfeilabschmtte als optimal bewertet weiden, weno die SdundzteiiH 
pcratunfifTciciiz kicincr ak 03*t! isL 

9. V^rfahren gemaB Ansprucfa 8, bd dem in dnem Sequenzbereich, fur den ein 'Mabsdmitt als Pkimer auf don d- 
nen Strang der Sequenz ausgewahlt weiden soli, de IS Primer mit den bodistea Gesamtbewertungen der dnzelnea 
Primer vorausgewahU werden und zu diesen ent^>rediend der vorfoestimmten optimalen Fragmentlang^ jewdls die 
besten zugehdrigen Teilabsdinitte auf dem gegenuberliegendeo Strang ausgewahlt werden, wobei aus den so gebil- 
deten Paaren von Teilabschnitten das Paar mit der hochsten Gesamtbewertung, die sidi aus der Bewertung der ein- 
zelnen Tdlabschnitte, der SdiTnelztemperamrdifferenz der betdligten Primer und der Fragmentlange ergibt, ausge- 
wahlt wild. 

10. ^^abren gemaB Anspruch 9, bei dem als zusatzlicher Parameter in einem voigegebenen Bereidi der Sequeoz 
die Lage des Primers rdativ zu dnem benachbarten Fragment zur Bildung dn^ vorbestimmten hfindestQberiap- 
pung orfasst wird. 

1 1 . Computerprogrammprodukt, das zur Hnnittiung von FHmer-Sequenzen und Primer-Paaren nadi einem ^ferfah- 
len gemaB einem der vorhergehenden Anspruche dngerichtet ist. 

12. V^chtung zur Ermilllung von Primer-Scqucnzcn und Primcr-Paarcn, die zur Durdifuhrung dncs ^^rfahrc^s 
mit den Schritten gemaB einem der vorheigehenden Anspruche eingerichtet ist, mit: 

- dner Einrichtung zur Erfassung einer Vielzahi von Teilabschnitten einer gegebenen DNA-Sequenz und von zu- 
gehdrigen charakteristischen Parametem, 

- einer Bewertungseinrichtung zur Bewertung der ermitleiten Parametei; 

- dner ersten Auswahldnrichtung, die dazu ausgelegt ist, als Primer ungedgnete Tdlabschnitte der Sequenz . 
zu verwcrfen, 

- dner zwdtcn Auswahldnrichtung, die dazu ausgelegt ist, die ubrigcn Ibilabschnittc zu bcwcrtcn, und 

- Hinnchtungen zur Spdcherung, Ausgabe und/oder Anzdge der ermittdten Primer-Sequenzen und Primer- 
Paaren. 
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